Introducción

Análisis estadístico

Row

Contexto del trabajo

La base de datos presenta información sobre datos personales y resultados de pruebas neuropsicológicas y psicométricas realizadas en adultos mayores.

Las pruebas neuropsicológicas o neurocognitivas son un método de diagnóstico que estudia el funcionamiento cerebral, permiten comprender el funcionamiento de diferentes áreas y sistemas del cerebro mediante la medición de las capacidades cognitivas del paciente

Las pruebas psicométricas son un método de evaluación usualmente usado por los departamentos de Recursos Humanos, puesto que permite determinar rasgos potenciales del paciente.

Row

Estructura de los datos

  • Datos Generales de la persona.
  • Mini Examen del Estado Mental.
  • Trail Making Test.
  • Geriatric Depression Scale (Escala de depresión Geriátrica).
  • Cuestionario de apoyo social.

Objetivos del trabajo

Utilizar las técnicas aprendidas tanto en el curso de Aprendizaje Estadístico como a través de la carrera, para realizar un análisis estadístico con el fin de poder generar nueva información a partir de los datos.

Análisis descriptivo

Gráficas de estadísticas descriptivas de las personas

Column

1

2

3

4

Column

1

2

3

4

Componentes Principales

Column

Análisis de Componentes Principales

Column

Gráfico de sedimentación

Proporción de Varianza Explicada

Análisis de Correspondencia

Column

Análisis de Correspondencia Múltiple

Column

Gráfico de Sedimentación

Proporción de Inercia Explicada

Regresión Logística

Column

Regresión Logística

Nivel de la variable dependiente tomada como éxito: “Sin problemas Cognitivos”

Modelo seleccionado usando algoritmo del mejor subconjunto

Odds Error Std. Valor z Valor P Sig
(Intercept) 22.5079980 1.0194353 3.0545056 0.0022543
Genero2 0.8232199 0.1976310 -0.9843188 0.3249588
Edad 0.9574184 0.0127037 -3.4253751 0.0006140
Alcohol1 0.7298563 0.3128900 -1.0064484 0.3141999
Alcohol2 0.5402708 0.8431672 -0.7302048 0.4652650
Discapacidad2 1.2154710 0.2006059 0.9727114 0.3306967
EstadoCas 2.2645909 0.2687323 3.0416666 0.0023527
EstadoViu 1.0771390 0.2559039 0.2903766 0.7715281
EstadoUL 0.7539042 0.3187271 -0.8863066 0.3754523
EstadoSep 0.9523346 0.3884881 -0.1257151 0.8999575
EstadoDiv 0.8899015 0.6029224 -0.1934651 0.8465947
DeprimidoNo Deprimido 1.8810441 0.1826179 3.4598297 0.0005405
  • Conjunto de entrenamiento (75%)
  • Conjunto de prueba (25%)
  • Tasa de acierto del 64%.
  • Column

    Resultados

    Bootstrap
    orignial bias sd
    (Intercept) 4.3432415 -3.9274977 1.0591361
    Genero -0.0490439 0.4647877 0.1817363
    Edad -0.0462106 0.4619545 0.0111716
    Alcohol -0.2439726 0.6597164 0.2011535
    Expuesto -0.0618694 0.4776132 0.1492926
    Discapacidad 0.1660777 0.2496662 0.1729159
    Estado -0.1144888 0.5302326 0.0564799
    Deprimido -0.6759992 1.0917430 0.1531049

    Arboles Aleatorios

    Column

    Árboles de decisión

    Algoritmo de Clasificación usando Random Forests

    Con problemas Sin problemas
    Con problemas 50 28
    Sin problemas 41 127

    Error de clasificación: 26.97%

    Tasa de acierto: 73.03%

    • 500 Arboles aleatorios usados
    • 5 variables seleccionadas al azar en cada corte
    • 75% de los datos usados como entrenamiento
    • 25% usados como conjunto de validación

    Reducción Precisión

    Reducción Gini

    Column

    Importancia de las variables

    Support Vector Classifier

    Column

    Clasificador de Vectores de Soporte

    Elección del mejor parámetro de coste

    Se usa un kernel lineal
    Coste Error Dispersión
    0.001 0.3538113 0.0678168
    0.010 0.2732002 0.0430720
    0.100 0.2522081 0.0652893
    1.000 0.2522081 0.0652893
    5.000 0.2522081 0.0652893
    10.000 0.2556866 0.0657091
    15.000 0.2556866 0.0657091
    20.000 0.2556866 0.0657091
    Usando el parámetro obtenido se tienen las siguientes predicciones
    Con problemas Sin problemas
    Con problemas 53 29
    Sin problemas 45 119
    • Observaciones del test mal clasificadas: 30.08 %

    • Tasa de aciertos: 69.92%

    • Número de vectores de soporte: 393

    Column

    Elección del coste